home *** CD-ROM | disk | FTP | other *** search
/ Nebula 1 / Nebula One.iso / Internet / WWW / Perl_WWW_Utilities / html2ps / README < prev   
Encoding:
Text File  |  1994-12-11  |  5.3 KB  |  141 lines

  1. This is html2ps 0.1 beta, an HTML-to-PostScript converter.
  2.  
  3.    THIS SOFTWARE IS PROVIDED "AS IS" WITH ABSOLUTELY NO WARRANTY.
  4.  
  5. The present version of html2ps is written in Perl. Perl is available
  6. from any comp.sources.misc archive.
  7.  
  8. The latest version of html2ps is available by anonymous ftp from
  9. "ftp://ftp.tdb.uu.se/pub/sources/html2ps/". You can either fetch the
  10. tar file, or the files individually. Use binary mode when retrieving
  11. the files.
  12.  
  13. Some PostScript code and some ideas have been taken from the PostScript
  14. generator in NCSA's Mosaic, by Ameet A. Raval & Frans van Hoesel.
  15.  
  16. The program has been developed and tested on different Suns running
  17. Solaris 2.3 with perl version 5.000, and SunOS 4.1.3 with perl version 4.0.
  18.  
  19. Author:
  20.     Jan Karrman, Dept. of Scientific Computing, Uppsala University, Sweden,
  21.     e-mail jan@tdb.uu.se.
  22.  
  23.  
  24. Features:
  25.  
  26.   * Most HTML tags are handled, see Notes/Bugs below for exceptions.
  27.  
  28.   * Scaling of the text to any size is possible (the line and page breaks
  29.     will off course be adjusted to fit the page).
  30.  
  31.   * It is possible to change the sizes and styles for all the 6 header
  32.     levels individually.
  33.  
  34.   * The font size used for preformatted text may be changed.
  35.  
  36.   * The size of the page can be adjusted. The defaults are adapted to the
  37.     A4 paper size.
  38.  
  39.   * The margin sizes may be changed.
  40.  
  41.   * Different fonts can be selected. You can easily add new fonts, an
  42.     example is given in the Perl script.
  43.  
  44.   * Printing in landscape mode is supported.
  45.  
  46.   * Anchor texts are underlined by default, this can be turned off.
  47.  
  48.   * No syntax check of the HTML code is done by the converter, but it is
  49.     possible to call an external HTML checker, specified via the command
  50.     line options. The default syntax checker is weblint.
  51.  
  52.   * Page numbers can be inserted.
  53.  
  54.   * A heading tag will cause a page break if the text is close to the end
  55.     of a page.
  56.  
  57.   * Highlighting tags is additively interpreted. For example, the HTML
  58.     code "<B><I>some text</I></B>" would produce bold italic text.
  59.     This can be turned off so only the innermost tag is interpreted
  60.     (here, the italics).
  61.  
  62.   * You can force a page break by including the comment <!--NewPage-->
  63.     in the HTML document, at the point you want the page break. This
  64.     action is not defined in the HTML specification. I would like to
  65.     have a special character (eg &page;), ignored by screen browsers,
  66.     but used to force a page break when printing a document.
  67.  
  68.   * The generated PostScript code is very compact, it will be less than
  69.     the size of the HTML file plus the size of a PostScript header
  70.     (presently about 8 kilobytes).
  71.  
  72.  
  73. Notes/Bugs:
  74.  
  75.   * In-line images are not handled. -- If the ALT attribute of <IMG> is
  76.     present, the corresponding text is written in place of the image.
  77.     If there is no ALT attribute, the text "[IMAGE]" is written (this
  78.     text can be changed via the command line options).
  79.  
  80.   * The <ISINDEX> tag is not implemented. -- Ignored.
  81.  
  82.   * The <FORM> and associated tags are not implemented. -- Ignored.
  83.  
  84.   * <PRE WIDTH=...> is not implemented. -- Handled as <PRE>.
  85.  
  86.   * The text between two HTML tags or special characters will be converted
  87.     into one PostScript string. If there is a large chunk of text between
  88.     two successive HTML tags (typically between <PRE> and </PRE> tags),
  89.     the length of the PostScript string may exceed some limitations in
  90.     the PostScript printer/viewer. As a work around, you can insert a few
  91.     HTML comments in the document.
  92.  
  93.   * The string "<PLAINTEXT>" in an HTML document terminates the HTML
  94.     entity, even if it is within an <XMP> or <LISTING> element. The tags
  95.     <XMP>, <LISTING> and <PLAINTEXT> are obsolete, you should use <PRE>
  96.     instead.
  97.  
  98.   * The PostScript code generated by html2ps is not compliant with the 
  99.     Document Structuring Conventions. This is because the line breaking
  100.     (and hence the page breaking) is done within the PostScript code
  101.     itself. So the %%Page and %%Pages comments cannot be generated in
  102.     advance.
  103.  
  104.   * A line break may occur at the position of a tag. For example, the code
  105.     "It looks <EM>awful</EM>. Hopefully it will be fixed.", may give a line
  106.     break between the word "awful" and the period.
  107.  
  108.  
  109. ToDo:
  110.  
  111.     Try to fix as much as possible in the Notes/Bugs section. The lack of
  112.     support for in-line images is perhaps the major deficiency of html2ps.
  113.     It will probably not be implemented in the near future though.
  114.  
  115.  
  116. Installation (Unix):
  117.  
  118.     I have only tested html2ps on Unix systems, I would like to hear your
  119.     experiences with installing it on other platforms.
  120.  
  121.     Make the Perl script executable (chmod 755 html2ps). To convert an HTML
  122.     file to PostScript, call the script with the HTML-file as parameter.
  123.     Use the -o option to save the PostScript code to a file, or redirect
  124.     the output in standard UNIX manner. For example:
  125.  
  126.         html2ps test.html > test.ps
  127.  
  128.     If you want to use the syntax check feature, you have to install some
  129.     HTML syntax check program. The program called by default is weblint
  130.     by Neil Bowers, available via anonymous ftp from ftp.khoros.unm.edu
  131.     in /pub/perl/www.
  132.  
  133.     The file html2ps.1 is a manual page, move it to a directory where the
  134.     manual pages are kept, and read it with 'man html2ps'. There is also
  135.     a plaintext version in the file manpage.txt.
  136.  
  137.  
  138. History:
  139.  
  140.   * 12 Dec 1994: Version 0.1 beta released.
  141.